1 סטודנטים יקרים לפניכם ספר תרגילים בקורס מבוא לסטטיסטיקה והסתברות הספר הוא חלק מקורס חדשני וראשון מסוגו בארץ בנושא זה, המועבר ברשת האינטרנט.On-line הקורס באתר כולל פתרונות מלאים לספר התרגילים, וכן את התיאוריה הרלוונטית לכל נושא ונוש הקורס כולו מוגש בסרטוני וידאו המלווים בהסבר קולי, כך שאתם רואים את התהליכים בצורה מובנית, שיטתית ופשוטה, ממש כפי שנעשה בשיעור פרטי. את הקורס בנה מר ברק קנדל, מרצה מבוקש במוסדות אקדמיים שונים ובעל ניסיון עתיר בהוראת המקצוע. אז אם אתם עסוקים מידי בעבודה, סובלים מלקויות למידה, רוצים להצטיין או פשוט אוהבים ללמוד בשקט בבית, אנחנו מזמינים אתכם לחוויית לימודים יוצאת דופן וחדשה לחלוטין, היכנסו עכשיו לאתר www.gool.co.il אנו מאחלים לכם הצלחה מלאה בבחינות צוות האתר GooL גוּל, בּ ש ביל ה תרגוּל...
פרק ראשון - סטטיסטיקה תיאורית תוכן סיווג משתנים (סולמות מדידה וסוגי משתנים)... 3 הצגת נתונים ) טבלאות וגרפים)... 7 מדדי מיקום מרכזי ) ממוצע, ממוצע משוקלל, חציון ושכיח)... 14 מדדי פיזור (טווח, טווח בין רבעוני,שונות וסטיית תקן)... 18 מדדי מיקום יחסי ) ציון תקן ואחוזונים)... 0 מקדם ההשתנות... טרנספורמצייה לינארית... 3 תרשים קופסה- 5...boxplot ניתוח פלטים סטטיסטיים... 7 שאלות מסכמות... 9 שאלות אמריקאיות על סטטיסטיקה תיאורית... 34 פרק שני קשר בין משתנים קשר בין שני משתנים כמותיים ) מדד הקשר של פירסון ורגרסיה )...43 קשר בין משתנים איכותיים... 49 קשר בין משתנה איכותי לכמותי... 50 פרק שלישי התפלגות נורמלית... 5 פרק רביעי התפלגות הדגימה ומשפט הגבול המרכזי הקדמה כללית... 56 התפלגות ממוצע המדגם ומשפט הגבול המרכזי... 58 פרק חמישי - שאלות אמריקאיות על כל חומר הלימוד... 6
3 פרק ראשון סטטיסטיקה תיאורית סיווג משתנים: רקע: סטטיסטיקה תיאורית הוא ענף בו לומדים כיצד לאסוף נתונים, להציג אותם ולנתח אותם. בסטטיסטיקה תיאורית אנו פונים לקבוצה מסוימת. באותה קבוצה אנו אוספים נתונים על הישויות באותה קבוצה. משתנה תכונה שיכולה לקבל מספר ערכים : דעה פוליטית, מקום מגורים, גובה של אדם וכדומה. חלוקה אחת של המשתנים הנמדדים היא לפי סולמות מדידה: מיון משתנים לפי סולמות המדידה: 1. סולם שמי (נומינאלי) משתנה שלערכיו יש משמעות רק מבחינת הזהות ואין עניין של יותר או פחות לדוגמה: מצב משפחתי רווק/נשוי/אלמן/גרוש; אזור מגורים. משתנה דיכוטומי ) הינו מסולם שמי) אותם משתנים שיש להם רק שני ערכים אפשריות זכר/נקבה. מעשן/לא מעשן. סולם סדר (אורדינאלי) כאשר לערכים של המשתנה בנוסף לשם לסדר אבל אין משמעות לגודל ההפרש. למשל,דרגה בצב משמעות גם ישנה. סולם רווחים (אינטרוולי) משתנה שלערכים שלו בנוסף לשם ולסדר בניהם יש משמעות לרווחים בין הערכים אבל אין משמעות ליחס בין הערכים. למשל, קומה בבניין. סולם לא כל כך פופולרי..3 סולם מנה/יחס משתנה שלערכיו בנוסף לשם, לסדר ולרווח יש משמעות גם ליחס בין הערכים. למשל, מספר מכוניות למשפחה, משקל אדם בק" הדרך הקלה ביותר כדי לזהות עם הסולם הוא סולם מנה היא על ידי מבחן האפס. בסולם מנה האפס הוא מוחלט, אבסולוטי, ומייצג אין..4
4 נבצע סיווג של המשתנים : סוגי משתנים: משתנה איכותי הוא משתנה שלערכיו אין משמעות של יותר או פחות, אין עניין כמותי לערכים המתקבלים. כמו : מקום מגורים של אדם (רעננה, תל אביב, אשדוד..) מין האדם (זכר, נקבה) מצב משפחתי ) רווק, נשוי, גרוש,אלמן) משתנה כמותי הוא משתנה שערכיו הם מספרים להם יש משמעות כמותית כמו : גובה אדם בס"מ, ציון בבחינה וכדומה. את המשתנה הכמותי נסווג לשני סוגים: משתנה בדיד : משתנה שערכיו מתקבלים מתוך סידרה של ערכים אפשריים.כמו: מספר ילדים למשפחה (1,,3..) ציון בבחינה ) מ 0 ועד 100 בקפיצות של ( 1 משתנה רציף: משתנה שערכיו מתקבלים מתוך אינסוף ערכים בתחום מסוים, הערכים מתקבלים ברצף וללא קפיצות של ערכים. כמו: גובה בס"מ אם למשל, הגובה הנמוך ביותר הוא 150 ועד 190 ס"מ בקבוצה הגבהים הם ברצף. גם בין 160 ל 161 ס"מ יש רצף אינסופי של ערכים אפשריים לגובה (16.33 ס"מ הוא גם גובה אפשרי ( משקל בק"ג, מהירות בקמ"ש וכולי. כמותי איכותי רציף בדיד
5 תרגילים: 1.לפניכם רשימה של משתנים: ה. ו. ז. ח. ט. גובה אדם בס"מ. מספר ילדים למשפחה. מידת חרדה לפני מבחן. שביעות רצון משירות לקוחות בסקלה מ 1 השכלה. מספר אוטובוס. מקום מגורים. מין ( 1 =גבר ו- =אישה). מידת נעליים. עד ) 7 1 כלל לא מרוצה עד 7 מרוצה מאד) ציינו באיזה סולם מדידה המשתנה הנחקר ) שמי, סדר, רווחים או מנה).להלן התפלגות מספר האיחורים לעבודה בחודש של העובדים בחברת "סטאר". בחברה 00 עובדים. מספר מספר האיחורים העובדים 17 0 3 1 85 50 3 5 4 מהו המשתנה הנחקר כאן? האם מדובר במשתנה איכותי או כמותי? אם הוא כמותי האם הוא בדיד או רציף? באיזה סולם מדידה המשתנה?
6 3.לפניכם רשימה של משתנים כמותיים. ציין ליד כל משתנה אם הוא רציף או בדי שכר עובד בש"ח. ציון בחינת בגרות. תוצאה בהטלת קובייה. מהירות ריצה בתחרות. שיעור התמיכה בממשלה. ה.
7 הצגת נתונים: רקע: דרכים להצגת נתונים שנאספו: רשימה של תצפיות: התצפית היא הערך שנצפה עבור ישות מסוימת בקבוצה. רושמים את התצפיות שהתקבלו כרשומה, יעיל שיש מספר מועט של תצפיות. ההצגה הזו רלבנטית לכל סוגי המשתנים. למשל, להלן מספר החדרים בבניין בן 5 דירות : 3 4 3 5 4 טבלת שכיחויות בדידה: f (X ) שםהמשתנה - X שכיחות שכיחות יחסית באחוזים f 1 100 N f 1 X 1 f 100 N f X f 3 100 N f 3 X 3 M M M f k N 100 f k X k 100% N = k f i i= 1 סה"כ רושמים את התצפיות בטבלה שבה עמודה אחת מבטאת את ערכי המשתנה והשנייה את השכיחות. יעיל עבור משתנה איכותי וכמותי בדיד וכשיש מספר רב של תצפיות. לא יעיל למשתנה כמותי רציף.
8 למשל, להלן התפלגות הציונים בכיתה מסוימת: f i n F i הציון -X מספר התלמידים השכיחות- f 0.08=/5 5 0.16=4/5 6 4 6 0.3=8/5 14 8 7 0.=5/5 19 5 8 0.16=4/5 3 4 9 0.08=/5 5 10 שכיחות מצטברת צבירה של השכיחויות: או שוות לערך. - השכיחות המצטברת נותנת כמה תצפיות קטנות F i שכיחות יחסית(פרופורצייה) השכיחות מחולקת לכמות התצפיות הכללי : מהתצפיות בקבוצה שוות לערך. - איזה חלק f i n טבלת שכיחויות במחלקות: משתמשים שהמשתנה כמותי רציף או כאשר יש מספר ערכים רב במשתנה הבדיד וטבלת שכיחויות תהיה ארוכה מידי. למשל, נתנו לקבוצת ילדים לבצע משימה מסוימת ובדקו את התפלגות זמן ביצוע המשימה בדקות. להלן ההתפלגות שהתקבלה: זמן בדקות 0.5-3.5 3.5-9.5 9.5-19.5 19.5-9.5 מספר הילדים 0 18 14 8
9 דיאגרמת עוגה: זהו התיאור הגרפי של משתנה איכותי. בדיאגראמת עוגה כל ערך במשתנה מקבל "נתח" יחסי מהעוגה. הנתח בעוגה פרופורציוני לשכיחות היחסית של ערך המשתנה בנתונים. התפלגות המצב המשפחתי אלמן 10% רווק 0% גרוש 5% נשוי 45% ה. דיאגרמת מקלות: הציר האופקי הוא הציר של המשתנה הציר האנכי של השכיחות הגובה של המקל מעיד על השכיחות. רלבנטי למשתנה כמותי בדי לא נהוג להשתמש בתיאור למשתנה איכותי וכמו כן לא למשתנה כמותי רציף. כמו כן בסולמות מדידה עבור משתנה מסולם סדר. התפלגותהציונים מספר התלמידים f- 9 8 7 6 5 4 3 1 0 5 6 7 8 9 10 הציון
10 ו. היסטוגרמה: ההיסטוגרמה היא הדרך הגרפית כדי לתאר טבלת שכיחויות במחלקות. רלבנטית למשתנה כמותי רציף. בהיסטוגרמה ציר האופקי הוא הציר של המשתנה וציר האנכי הוא הציר של הצפיפות. הצפיפות מחושבת בכל מחלקה על ידי חלוקת השכיחות ברוחב של כל המחלקה והיא נותנת את מספר התצפיות הממוצע בכל מחלקה ליחדה. אם המחלקות הן שוות ברוחב, ניתן לשרטט את ההיסטוגרמה לפי השכיחות ואין צורך בצפיפות. רוחב 3 6 10 10 אמצע 6.5 14.5 4.5 שכיחות 0 18 14 8 מצטברת 0 38 5 60 צפיפות 6.6667 3 1.4 0.8 0.5 3.5 9.5 19.5 X - - - - 3.5 9.5 19.5 9.5 פוליגון- מצולעון: אם נחבר את אמצע קצה כל מלבן בקווים ישרים. נותן מראה חזותי לצורה של התפלגות המשתנה.
11 צורות התפלגות נפוצות התפלגות סימטרית פעמונית- רוב התצפיות במרכז וככל שנתרחק מהמרכז יהיו פחות תצפיות באופן סימטרי. למשל,ציוני.IQ ישנן התפלגויות סימטריות שאינן פעמוניות: התפלגות אסימטרית ימנית ) חיובית) רוב התצפיות מקבלות ערכים נמוכים ויש מיעוט הולך וקטן של תצפיות שמקבלות ערכים גבוהים קיצוניים. למשל,שכר במשק. התפלגות א-סימטרית ימנית או חיובית Mo Md X התפלגות אסימטרית שמאלית ) שלילית) רוב התצפיות מקבלות ערכים גבוהים ויש מיעוט הולך וקטן של תצפיות שמקבלות ערכים נמוכים קיצוניים. למשל,אורך חיים התפלגות א-סימטרית שמאלית או שלילית X Md Mo
1 תרגילים: : 5 צפו בערוץ הראשון, 5 צפו בערוץ 10 1. בסקר צפייה בטלוויזיה התקבלו התוצאות הבאות:, 75 צפו בערוץ השני, 50 צפו באחד מערוצי הכבלים ו - 5 לא צפו בטלוויזיה בזמן הסקר. רשמו את טבלת השכיחות ואת השכיחות היחסית. תארו את הנתונים באופן גרפי.. להלן נתונים על התפלגות המקצוע המועדף של תלמידי שכבה ו' בבית הספר "מעוף" מספר התלמידים 44 0 1 6 המקצוע מתמטיקה תנ"ך אנגלית היסטוריה מהו המשתנה הנחקר? מהי פרופורציית התלמידים שמעדיפים תנ"ך? 3. להלן התפלגות ההשכלה במקום עבודה מסוים: מספר העובדים 60 10 0 השכלה נמוכה תיכונית אקדמאית מהו המשתנה הנחקר? מאיזה סולם הוא? תארו את הנתונים באופן גרפי. 4. להלן רשימת הציונים של 0 תלמידים שנבחנו במבחן הבנת הנקרא: 7,6,8,9,10,6,4,5,8,7,6,7,6,8,9,6,7,8,5,6 מהו המשתנה? האם הוא בדיד או רציף? תאר את הרשימה בטבלת שכיחויות. הוסף שכיחויות יחסיות לטבלה. תאר את הנתונים באופן גרפי.
13 5. להלן היסטוגרמה המתארת את התפלגות הגבהים בס"מ של קבוצה מסוימת: צפיפות 3 1 155 160 165 170 180 190 גובה מהו המשתנה הנחקר? האם הוא בדיד או רציף? תאר את הנתונים בטבלת שכיחויות במחלקות. הוסף שכיחות יחסית לטבלה. הוסף את הצפיפות של כל מחלקה לטבלה. ה. מהי צורת ההתפלגות של הגבהים? 6. להלן התפלגות המשקל של קבוצה מסוימת בק"ג: מספר מקרים משקל 10 40-45 0 45-50 30 50-60 0 60-65 10 65-70 תאר את ההתפלגות באופן גרפי. מה ניתן להגיד על צורת ההתפלגות?
14 מדדי מיקום מרכזי: רקע: המטרה במדדי המיקום המרכזי למדוד את מרכז ההתפלגות של התצפיות. השכיח MODE השכיח הוא הערך הנפוץ ביותר בהתפלגות. ברשימה : הערך החוזר על עצמו הכי הרבה פעמים. בטבלת שכיחויות בדידה : הערך שהשכיחות שלו היא הגבוהה ביותר. בדיאגרמת מקלות : שיעור ה- X של המקל הגבוה ביותר. בעוגה: הערך של הפלח הגדול ביותר. בטבלת שכיחויות במחלקות: המחלקה עם הצפיפות הגבוהה ביותר. בהיסטוגרמה המחלקה הגבוהה ביותר. יתכן שלהתפלגות יותר משכיח אח השכיח הוא מדד הרלבנטי לכל סוגי המשתנים. החציון MEDIAN החציון הוא ערך שמחצית מהתצפיות קטנות או שוות לו ומחצית מהתצפיות גדולות או שוות לו. ברשימה : נסדר את התצפיות בסדר עולה. אם יש מספר אי זוגי של איברים מקומו של החציון יהיה התצפית שמיקומה : אם יש מספר זוגי של איברים החציון יהיה הממוצע של האיבר ה- כלומר שיש מספר אי-זוגי של תצפיות החציון יהיה : ושיש מספר זוגי של תצפיות החציון יהיה : n+ 1 n md = X n + 1 X md = n + X n + 1 בטבלת שכיחויות בדידה: נעשה תהליך דומה אך נעזר בשכיחות המצטברת. בטבלת שכיחויות במחלקות: המחלקה החציונית היא המחלקה שמיקומה החציון אינו רלבנטי למשתנה מסולם שמי ולא רלבנטי למשתנה איכותי. והאיבר ה- + 1 n n
15 הממוצע: הנו מרכז הכובד של ההתפלגות. ברשימה : x = n i= 1 n x i בטבלת שכיחויות : x = x f n במחלקות :נשתמש באותה נוסחה רק נתייחס לאמצע המחלקה בתור ה X. הממוצע הזה יהיה ממוצע מקורב ולא אמיתי. הממוצע רלבנטי רק למשתנה כמותי. ממוצע משוקלל: x = k j= 1 x n N j j מדדי המיקום המרכזי בהתפלגויות המיוחדות: בהתפלגות סימטרית פעמונית כל מדדי המרכז שווים זה לזה: התפלגות סימטרית x Md Mo בהתפלגות סימטרית השכיח לא חייב להיות במרכז: התפלגותU Mo 1 X Mo Md בהתפלגות אסימטרית התפלגות א-סימטרית ימנית או חיובית התפלגות א-סימטרית שמאלית או שלילית X Md Mo Mo Md X
16 תרגילים: להלן רשימת הציונים של 0 תלמידים שנבחנו במבחן הבנת הנקרא: 7,6,8,9,10,6,4,5,8,7,6,7,6,8,9,6,7,8,5,6 חשב את החציון, השכיח, והממוצע של הציונים..1. בדקו את מספר החדרים לדירה בבניין בן 5 דירות והתקבל ממוצע 3.8 לגבי 4 דירות נמצא מספר חדרים :,5. 4,3,4 כמה חדרים יש בדירה החמישית? מהו השכיח ומהו החציון? 3. להלן התפלגות מספר מקלטי הטלוויזיה שנספרו עבור כל משפחה בישוב מסוים: מספר משפחות 8 18 10 מספר מקלטים 0 1 3 4 חשב את הממוצע, החציון והשכיח של ההתפלגות. הסבר ללא חישוב כיצד כל מדד שחישבת בסעיף א' היה משתנה אם חלק מהמשפחות (לא כולן) שלא היה להם עד היום טלוויזיה היו רוכשים מקלט אח 4. להלן התפלגות מספר המכוניות למשפחה בישוב "הגורן" 5 4 3 מספר מכוניות למשפחה 1 55 140 0 150 65 שכיחות כמה משפחות יש בישוב? מה אחוז המשפחות בישוב עם לכל היותר מכוניות? חשבו את הממוצע, החציון והשכיח. הקפידו להסביר לגבי כל סעיף מה משמעות התוצאה שקיבלתם!
17 5. להלן התפלגות המשקל של קבוצה מסוימת בק"ג: מספר מקרים משקל 10 40-45 0 45-50 30 50-60 0 60-65 10 65-70 מהי המחלקה השכיחה והחציונית. חשב אומדן לממוצע. האם היה ניתן לדעת מהי התשובה לסעיף ב ללא חישוב? הסבר 6. להלן נתונים לגבי ציונים במבחן באנגלית ב- 3 כיתות מתוך שכבה י' בתיכון: כיתה 1 3 ממוצע 76 68 8 מס' תלמידים 40 0 30 חשב את הממוצע המשוקלל בשכבה. שאלה 1 החציון: 7 השכיח: 6 הממוצע: 6.9 שאלה 3 שכיח: 3,4 חציון: 4 תשובות סופיות שאלה 3 הממוצע: 1.7 החציון: 1.5 השכיח: 1 הממוצע יגדל ויתר המדדים לא ישתנו. שאלה 4 630 34.13% שכיח וחציון :3 שאלה 6 76. ממוצע:.95
18 מדדי פיזור: רקע: המטרה : למדוד את הפיזור של הנתונים כלומר כמה הם רחוקים זה מזה. הטווח\תחום :RANGE R= X X max min ההפרש בין התצפית הגבוהה ביותר לנמוכה ביותר : טווח בין רבעוני Inter Quartile Range - IQR הטווח שבין הרבעון התחתון (אחוזון 5) עד הרבעון העליון (אחוזון 75). הרבעון התחתון מסומן ב- Q 1. IQR= Q Q 3 1. Q 3 הטווח הבין רבעוני הוא: והרבעון העליון מסומן ב- הטווח הבין רבעוני נותן אינדיקציה על הטווח של 50% התצפיות המרכזיות. שונות וסטיית תקן: השונות היא ממוצע ריבועי הסטיות מהממוצע : Sˆ = n i= 1 x ( x x) i n 1 עבור סדרת נתונים: סטיית התקן - deviation Standard על-מנת לקבל תוצאה בממדי הבעיה נחשב את שורש השונות ונקבל את סטיית התקן. ˆ ˆ נסמן סטיית תקן ב- x) S ˆ( ונחשב באמצעות x). S( x) = S ( חישוב שונות וסטיית תקן בטבלת שכיחויות : Sˆ x = x ( x x) f ( x) n 1
19 תרגילים: להלן רשימת הציונים של 0 תלמידים שנבחנו במבחן הבנת הנקרא: 7,6,8,9,10,6,4,5,8,7,6,7,6,8,9,6,7,8,5,6 חשבו את השונות, סטיית התקן והטווח של הציונים. להלן התפלגות מספר המכוניות למשפחה בישוב "הגורן".1. 5 4 3 מספר מכוניות למשפחה 1 55 140 0 150 65 שכיחות חשבו סטיית התקן. חשבו את הטווח ואת הטווח הבין-רבעוני של הנתונים. הקפידו להסביר לגבי כל סעיף מה משמעות התוצאה שקיבלתם! בחברה העוסקת בטלמרקטינג בדקו עבור כל עובד את מספר שנות הוותק שלו. הוותק הוא 4 שנים וסטיית התקן היא שנתיים. התקבל שממוצע שנות.3 האם הממוצע יגדל/יקטן/לא ישתנה וסטיית התקן תגדל/תקטן/לא תשנה כאשר עובדים עם וותק של 4 שנים להתפלגות? האם הממוצע יגדל/יקטן/לא ישתנה וסטיית התקן תגדל/תקטן/לא תשנה כאשר ובדים אשר אחד עם וותק של 0 שנים והשני עם וותק של 8 שנים להתפלגות? יתווספו שני יתווספו שני ע נתונה רשימה של 5 תצפיות, אך רק עבור 4 מהן נרשמו הסטיות שלהן מהממוצע: 1-, 3,,. חשב את השונות של חמש התצפיות..4 פתרונות: שאלה 1 השונות:.305 סטיית תקן: 1.518 טווח: 6 שאלה 3 ממוצע לא ישתנה, סטיית התקן תקטן שאלה סטיית תקן :1.106 טווח: 4 טב"ר: שאלה 4 תשובה: 13.5 ממוצע לא ישתנה, סטיית התקן תגדל
0 רקע: ה. מדדי מיקום יחסי: המטרה למדוד איך תצפית ממוקמות יחסית לשאר התצפיות בהתפלגות. ציון תקן: Z = X X Sˆ הנוסחה לציון תקן של תצפית היא : ציון התקן נותן כמה סטיות תקן סוטה התצפית מהממוצע. כלומר, ציון התקן מעיד על כמה סטיות תקן התצפית מעל או מתחת לממוצע. ציון תקן חיובי אומר שהתצפית מעל הממוצע. ציון תקן שלילי אומר שהתצפית מתחת לממוצע. ציון תקן אפס אומר שהתצפית בדיוק בממוצע. אחוזונים/מאונים. האחוזון ה- p הוא הערך בנתונים המחלק את הנתונים בצורה כזאת שעד אליו יש % p מהנתונים. מסמנים את האחוזון ה- בp X. p - חישוב האחוזון מתוך נתונים בטבלה האחוזון הוא הערך שבו בפעם הראשונה השכיחות היחסית המצטברת (באחוזים) גדולה או שווה ל- %p.
1 תרגילים: 1.תלמידי כיתה ח' נגשו למבחן בלשון ולמבחן במתמטיקה. להלן התוצאות שהתקבלו: המקצוע ממוצע סטיית תקן 1 16 74 80 לשון מתמטיקה עודד קיבל: 68 בלשון ו 70 במתמטיקה. באיזה מקצוע עודד טוב יותר באופן יחסי לשכבה שלו? איזה ציון עודד צריך לקבל במתמטיקה כדי שיהיה שקול לציונו בלשון?. להלן התפלגות מספר המכוניות למשפחה בישוב "הגורן" 5 4 3 מספר מכוניות למשפחה 1 55 140 0 150 65 שכיחות חשבו את: העשירון התחתון. האחוזון ה- 30. הערך ש- 0% מהתצפית גדולות ממנו. רבעון עליון. פתרונות: שאלה 1 לשון תשובה: 7 שאלה 1 4 4
ו. מקדם ההשתנות מקדם ההשתנות Coefficient of Variation כאשר מחשבים סטיית תקן למספר קבוצות בעלי ממוצע שונה, השוואת מידת פיזור הנתונים אינה מתייחסת לערך מרכז הנתונים (לממוצע למשל). על מנת לתת מדד פיזור המתחשב בממוצע הנתונים נחשב את מקדם ההשתנות - Variation :Coefficient of Ŝ( X) CV = X ככל שמקדם ההשתנות נמוך יותר המשתנה מרוכז יותר סביב הממוצע וככל שמקדם ההשתנות גבוהה יותר, מידת הפיזור סביב הממוצע גבוהה יותר. תרגילים: 1. להלן נתונים לגבי ציונים במבחן באנגלית ב- 3 כיתות מתוך שכבה י' בתיכון: כיתה 1 3 ממוצע 76 68 8 מס' תלמידים 40 0 30 סטיית תקן 1 15 10 חשבו את מקדם ההשתנות בכל כיתה. מהי הכיתה הכי הטרוגנית? נתונות שתי קבוצות: הממוצע בקבוצה א 100 והשונות 100. הממוצע בקבוצה ב 500 והשונות 400. באיזו קבוצה מידת הפיזור יחסית קטן יותר?. פתרונות: שאלה 1 כתה ב שאלה קבוצה
3 רקע: ז. טרנספורמציה לינארית: מצב שבו מבצעים שינוי מסוג הוספה של קבוע ) או החסרה ( והכפלה של קבוע ) או חילוק) לכל y= b x+ התצפיות: a וכך יושפעו המדדים השונים: Moy = b Mo+ a y= b x+ a Md = b Md + a p y y = b x + a sˆ y sˆ = b sˆ = b sˆ p x y x IQR y x = b IQR X R y = b R X שלבי העבודה: נזהה שמדובר בטרנספורמצייה לנארית ) שינוי קבוע לכל התצפיות). נירשום את כלל הטרנספורמצייה לפי נתוני השאלה. נפשט את הכלל ונזהה את ערכי a ו b. נציב בנוסחאות שלעיל בהתאם למדדים שנשאלים..1..3.4
4 תרגילים: עבור סדרת נתונים התקבל: X = 80 Sˆ = 15 MO= 70 הוחלט להכפיל את כל התצפיות פי- 4 ולהחסיר מהתוצאה 5. חשב את המדדים הללו לאחר השינוי..1 בחברה מסוימת השכר הממוצע הוא 40 לשעה עם סטיית תקן של 5 לשעה. הוחלט להעלות את כל המשכורות ב-, 10% אך זה לא סיפק את העובדים ולכן הם קיבלו לאחר מכן תוספת של לשעה. מה הממוצע ומהי השונות של השכר לשעה לאחר כל השינויים.. פתרונות: שאלה 1 הממוצע: 315 סטיית התקן: 60 השכיח: 75 שאלה הממוצע: 46 השונות: 30.5
5 רקע:.1..3 ח. תרשים קופסא- boxplot תרשים קופסא הינו תרשים שבעזרתו ניתן לבחון: את המרכז של ההתפלגות על ידי החציון ) Q) את הפיזור של הנתונים (הטווח והטווח הבין רבעוני) את צורת ההתפלגות (סימטרית \אסימטרית ימנית או אסימטרית שמאלית) MIN Q 1 Q Q 3 MAX 10 11 1 13 14 15 16 17 18 19 0 תרגילים: 1. להלן התפלגות מספר החדרים לדירות שנבנו בשנת 009 בעיר אשדו 50 00 נמספר הדירות 150 100 50 0 04 136 89 68 15 40 3 1 3 4 5 6 7 מספרהחדרים מצא את החציון, הרבעון התחתון והרבעון העליון של ההתפלגות. שרטט דיאגרמת קופסא להתפלגות. מה ניתן לומר על צורת ההתפלגות?
6. להלן דיאגרמת קופסא המתארת את התפלגות הגיל בשנים באוכלוסייה מסויימת: מהו בערך הגיל החציוני באותה אוכלוסייה? מה בערך טווח הגילאים? מה ניתן להגיד על צורת ההתפלגות? פתרונות: שאלה 1 חציון 4 רבעון תחתון 3 רבעון עליון 5 שאלה חציון 40 טווח 70 התפלגות אסימטרית ימנית כמעט סימטרית
7 ט. ניתוח פלטים 1. להלן פלט על התפלגות הגילאים באוכלוסייה מסוימת. Statistic Age of Respondent Mean 45.63 Median 41.00 Variance 317.140 Std. Deviation a Minimum 18 Maximum b Range 71 Interquartile Range 8 מצא את הערכים בטבלה המסומנים ב a ו. b נתון שההתפלגות היא אסימטרית האם היא נוטה ימינה או שמאלה?
8. להלן התפלגות ההשכלה של העובדים בחברת "מתאר": years of education Frequency Percent Valid Percent Cumulative Percent Valid 8.00 7 1.7 1.7 1.7 9.00 4 7.3 7.3 0.0 10.00 3.6 3.6 3.6 11.00 14 5.5 5.5 49.1 1.00 10 18. 18. 67.3 13.00 3.6 3.6 70.9 14.00 4 7.3 7.3 78. 15.00 7 1.7 1.7 90.9 16.00 4 7.3 7.3 98. 18.00 1 1.8 1.8 100.0 Total 55 100.0 100.0 Statistic years of education Mean? Median 1.0000 Variance? Std. Deviation.54786 Minimum? Maximum? Range? Interquartile Range? מלא את הערכים המסומנים בסימני שאלה. פתרונות: שאלה 1 שאלה הממוצע: 11.909 שונות: 6.49 10 3 טווח : a=17.81 b=89 אסימטרית ימנית טב"ר:
9 י. שאלות מסכמות: בפקולטה להנדסה אספה מזכירות הסטודנטים נתונים לגבי מס' הקורסים שכל סטודנט סיים בשנה הראשונה ללימודיו בשנת 008. להלן התוצאות שהתקבלו:.1 60 50 מספר הסטודנטים 40 30 0 10 0 1 3 4 5 6 מספר הקורסים מה המשתנה הנחקר? האם הוא בדיד או רציף? מהי צורת ההתפלגות? תאר את הנתונים בטבלת שכיחויות. חשב את השכיח, החציון והטווח.
30 להלן התפלגות הציונים בבחינה בלשון שנעשתה עבור תלמידי כיתות ד'. השתתפו במחקר 150 תלמידים. ממוצע הציונים שהתקבל: 1 7 = X 15. ציון 4 5 6 7 8 9 10 מספר התלמידים 1 16 38 14 10 השלם את השכיחויות החסרות בטבלה. חשב את הציון החציוני, השכיח. חשב שונות וסטיית תקן להתפלגות הציונים. הוחלט לשנות את סקלת הציונים ולהכפיל את הציון ב- 10. למשל, ציון 8 יהפוך להיות 80. מה הממוצע ומהי השונות של הציונים בסקלה זו?
31 להלן התפלגות מספר האיחורים לעבודה בחודש של העובדים בחברת "סטאר". בחברה 00 עובדים. שכיחות שכיחות יחסית מספר האיחורים (פרופורציה) 15% 0 0% 1 30% 0% 3 4 השלם את הטבלה. חשב את החציון, השכיח, והממוצע של התפלגות. מהי סטיית התקן של ההתפלגות. מה העשירון העליון של ההתפלגות? מהו הטווח והטווח הבין רבעוני? ה. מה ציון התקן של רינה שאיחרה פעמיים? ו. כיצד ישתנה החציון, הממוצע וסטיית התקן אם מסתבר שאלה שאיחרו 4 ז. פעמים בפועל איחרו 3 פעמים? הסבר..3
3 חברה סלולארית דגמה 00 אנשים. עבור כל אדם נבדק מידת שביעות הרצון של הלקוח מהחברה( 1 שביעות רצון נמוכה ועד 5 שביעות רצון גבוהה) להלן ההתפלגות שהתקבלה:.4 שביעות רצון 1 3 4 5 מספר האנשים 40 60 50 30 0 מה אחוז האנשים עם רמת שביעות רצון נמוכה? מה המשתנה הנחקר ומאיזה סוג הוא? מהי הדרך הגרפית המתאימה ביותר לתיאור הנתונים? i. היסטוגרמה..ii דיאגרמת מקלות..iii דיאגרמת עוגה חשבו את המדדים הבאים: 1. טווח. שכיח 3. חציון
33 שאלה 1 מספר הקורסים. בדי התפלגות אסימטרית שמאלית (שלילית) השכיח: 5 הטווח: 5 החציון: 4 פתרונות: שאלה 0 תלמידים קיבלו ציון 6 ו- 40 תלמידים קיבלו ציון 8. החציון: 7 השכיח: 8 השונות:.533 סטיית התקן: 1.59 הממוצע: 70.67 השונות: 53.3 שאלה 3 החציון: השכיח: הממוצע: סטיית תקן: 1.7 תשובה: 4 טב"ר: טווח : 4 ה. תשובה: 0 ו. חציון לא ישתנה, ממוצע יקטן ז. וסטיית התקן תקטן. שאלה 4 תשובה: 0% שביעות רצון ) סדר) תשובה: טווח: 4 שכיח: חציון:.5
34 יא. שאלות אמריקאיות: שאלות 1-3 מתייחסות לקטע הבא: לפניך שתי עקומות המתארות את התפלגות ההכנסות החודשיות של שתי משפחות שנבחרו באקראי: משפחה א' משפחה ב' 8000 ש"ח 6000 ש"ח הכנסה חודשית שאלה 1 לאיזו משפחה הכנסה שכיחה גבוהה יותר? משפחה א' משפחה ב' לשתיהן אותה הכנסה שכיחה לא ניתן לדעת אין מספיק נתונים שאלה באיזו משפחה ההכנסה החציונית שווה להכנסה הממוצעת? משפחה א' משפחה ב' בשתיהן ההכנסה החציונית שווה להכנסה הממוצעת לא ניתן לדעת אין מספיק נתונים 3 שאלה באיזו משפחה סטית התקן של ההכנסה החודשית גבוהה יותר? משפחה א' משפחה ב' לשתיהן אותה סטית תקן לא ניתן לדעת אין מספיק נתונים
35 הנתונים הבאים מתייחסים לשאלות 4-6 להלן נתונים חלקיים של טבלת שכיחויות: f(x) x? 10 6 15? 0 1 3 4 50 סה"כ 1.66 הממוצע הוא כמו כן נתון: שאלה 4 השכיח של הנתונים הוא: 0 15 ישנם שני שכיחים: 0 ו- 3 על סמך הנתונים החלקיים אי אפשר לקבוע מה יהיה ערכו של השכיח. שאלה 5 חציון הנתונים הוא: 1.5 5.5 על סמך הנתונים החלקיים אי אפשר לקבוע מה יהיה ערכו של החציון. שאלה 6 הטווח של הנתונים 11 3 4 על סמך הנתונים החלקיים אי אפשר לקבוע מה יהיה ערכו של החציון.
36 שאלה 7 בהתפלגות אסימטרית ימנית של משתנה כמותי רציף, הערך המתאים למאון ה- 30, ציון התקן שלו הוא בהכרח: שלילי חיובי אפס לא ניתן לדעת ללא ידיעת הנתונים. שאלה 8 סדרת נתונים סטטיסטיים מונה 10 תצפיות. נתון כי סדרת הנתונים סימטרית סביב הממוצע. ממוצע הסדרה - 40 ושונות הסדרה -.100 בשלב מאוחר יותר נוספו שתי תצפיות נוספות לסדרה: 50 ו- 30. השונות של 1 התצפיות היא: תקטן תגדל לא תשתנה לא ניתן לחשב את השונות ללא ידיעת התצפיות.
37 הנתונים הבאים מתייחסים לשאלות 9-10 בחברת "טיק" המשכורת הממוצעת היא 4,600 ש"ח וסטיית התקן של משכורת זו הינה 00 ש"ח. לאחר מו"מ עם ועד עובדי ההנהלה סוכם כי המשכורת תוכפל פי 1.5 לרווחיות שאלה 9 מהי המשכורת הממוצעת החדשה :.,300. 6,900.4,650.4,600 חסרים נתונים כדי לדעת. ה. שאלה 10 מהי סטיית התקן של המשכורת לאחר יישום המו"מ לגבי השכר? 00 300 675 לא ניתן לדעת שאלה 11 הוספת גודל קבוע לכל תצפיות סדרת נתונים. תגדיל את סטיית התקן. תקטין את סטיית התקן. לא תשנה את סטיית התקן. לא ניתן לדעת.
38 הנתונים הבאים מתייחסים לשאלות 1-14 להלן נתונים על ציוני תלמידים שנבחנו במועדים שונים בסטטיסטיקה : שם התלמיד צבי סטף שרית לובה מיטב ציון 50 8 65 60 70 ממוצע הציונים במועד בו נבחן 50 80 60 63 70 סטיית התקן של הציונים במועד בו נבחן 1 5 15 1.5 10 שאלה 1 התלמיד הטוב ביותר ביחס לנבחנים באותו מועד בו נבחן הוא : מיט צבי. לובה. שרית. סטף. ה. שאלה 13 פנינה נבחנה עם סטף וציון התקן שלה שווה לציון התקן של שרית לכן ציונה הוא : 80.55 65 80 81.66 שאלה 14 איזו כיתה היא ההומוגנית ביותר. הכיתה של מיט צבי. לובה. שרית. סטף. ה.
39 7 8 6 10 הנתונים הבאים מתייחסים לשאלות 15-18 בבדיקת פתע של משרד הבריאות במפעל שוקולד נמצא ש: 5 4 3 1 0 שוקולד פגום 11 13 1 48 63 35 מס' קופסאות שאלה 15 מהו החציון של מספר הפגומים בקופסא:.1. 4. לא ניתן לדעת. שאלה 16 מהו הרבעון התחתון של מספר הפגומים בקופסא?.1.3 4. לא ניתן לדעת. ה. מספר הפגומים בקופסא הוא משתנה: סדר. שמי. כמותי בדיד כמותי רציף השכיח של מספר הפגומים בקופסא: 63 ה. 1 ו. 00 ז. לא ניתן לדעת. ח. שאלה 17 שאלה 18
40 שאלה 19 ביחס לציר המספרים רוב הערכים בהתפלגות א-סימטרית ימנית נמצאים: בערכים הגבוהים. בחלוקה זהה בין הערכים הגבוהים והנמוכים. בערכים הנמוכים. לא ניתן לדעת. אף לא תשובה מהנ"ל נכונה. ה. ה. שאלה 0 בוצע מחקר על מספר העובדים בחברות מזון לעומת חברות תקשורת. החציון והממוצע בשתיהן שווה 8. איזה מהטענות הבאות היא הנכונה והמלאה ביותר: השכיחות ב החברות זהה אך שונה מ 8. השכיח ב החברות זהה אך לא ניתן לדעת מהו. השכיח בשתי חברות הינו בהכרח 8. שכיח בחברה אחת שונה מ 8 ובשנייה הוא 8 אף תשובה אינה נכונה הנתונים הבאים מתייחסים לשאלות 1 עד 5 מס' משפחות 40 30 נערך סקר על מספר מקלטי הטלוויזיה הנמצאים בבית. תוצאות הסקר נתונות בדיאגרמת מקלות הבאה : 0 1 3 4 המשתנה הנחקר כאן הוא: משתנה שמי. משתנה מסולם סדר. משתנה כמותי בדי משתנה כמותי רציף. מס' מקלטי טלוויזיה שאלה 1 15 10 5
41 הטווח של ההתפלגות הוא: 35 4 3 שאלה שאלה 3 ממוצע מספר מקלטי הטלוויזיה למשפחה הוא: 1.65 1.5 1 השכיח של התפלגות זו היא: 40 1.5 1 שאלה 4 שאלה 5 מסתבר שיש בין ל- 5 משפחות נוספות שאין להם מקלטי טלוויזיה. ויש לצרף את המשפחות הללו להתפלגות. כיצד הנתון זה ישפיע על סטיית התקן? יקטין אותו. יגדיל אותו. לא ישנה אותו. אין לדעת
4 פתרונות שאלה 1 3 4 5 6 7 8 9 10 11 1 13 14 15 16 17 18 19 0 1 3 4 5 תשובה א ג ג ג ב ג א ג ב ב ג ה ד ג ב א ג ב ג ה ג ב א ג ב
43 פרק שני קשר בין משתנים מדד הקשר הלינארי קשר בין שני משתנים כמותיים רקע המטרה היא לבדוק האם קיים קשר (קורלציה, מתאם) של קו ישר בין שני משתנים כמותיים. בדרך כלל, X הוא המשתנה המסביר (הבלתי תלוי) ו Y הוא המשתנה המוסבר (התלוי).למשל, נרצה להסביר כיצד השכלה של אדם הנמדדת בשנות לימוד X מסבירה את ההכנסה שלו Y. במקרה זה שנות ההשכלה זהו המשתנה המסביר ) או הבלתי תלוי ( ואנחנו מעוניינים לבדוק כיצד שינויים בשנות ההשכלה של אדם יכולים להסביר את השינויים שלו בהכנסה, ולכן רמת ההכנסה זהו המשתנה המוסבר התלוי במשתנה המסביר אותו. בשלב הראשון, הקשר בין שני המשתנים. נהוג לשרטט דיאגרמת פיזור. זו דיאגרמה שנותנת אינדיקציה ויזואלית על טיב בשלב השני, מחשבים את מקדם המתאם ) מדד הקשר ( שבודק עד כמה קיים קשר לינארי בין שני המשתנים. המדד ) ניקרא גם מדד הקשר של פירסון) מכמת את מה שניראה בשלב הראשון רק בעין. המדד בודק את כיוון הקשר ) חיובי או שלילי). ואת עוצמת הקשר ) חלש עד חזק). מקדם מתאם זה מקבל ערכים בין 1- ל 1. מקדם מתאם 1 - או 1 אומר שקיים קשר לינארי מוחלט ומלא בין המשתנים שניתן לבטאו על ידי. y= bx+ הנוסחה : a מתאם חיובי מלא ) מקדם מתאם 1) אומר שקיים קשר לנארי מלא בו השיפוע b יהיה חיובי ואילו מתאם שלילי מלא אומר שקיים קשר לנארי מלא בו השיפוע b שלילי ) מקדם מתאם 1-).
44 מתאם חיובי חלקי אומר שככל שמשתנה אחד עולה לשני יש נטייה לעלות בערכו אבל לא קיימת נוסחה לינארית שמקשרת את X ל- Y באופן מוחלט ואילו מתאם שלילי חלקי אומר שככל שמשתנה אחד עולה לשני יש נטייה לרדת אבל לא קיימת נוסחה לינארית שמקשרת את X ל- Y באופן מוחלט. ככל שערך מקדם המתאם קרוב לאפס נאמר שעוצמת הקשר חלשה יותר וככל שמקדם המתאם רחוק מהאפס נאמר שעוצמת הקשר חזקה יותר. מקדם המתאם יסומן באות r. כדי לחשב את מקדם המתאם, יש לחשב את סטיות התקן של כל משתנה ואת השונות המשותפת. ( X X )( Y Y ) i i cov( x, y) = שונות משותפת : n 1 ˆ ( X X ) i S = שונות של המשתנה X: X n 1 ˆ ( Y Y ) i S = שונות המשתנה Y: Y n 1 r x, y cov( x, y) = Sˆ Sˆ X Y מקדם המתאם הלינארי : בשלב השלישי, במידה וקיים קשר חזק בין שני המשתנים נהוג לבצע ניבויי. לבנות קו ניבויים הנקרא גם קו רגרסיה המנבא משתנה אחד על סמך האחר. מדובר בקו שמנבא את Y על סמך X. השיטה למציאת הקו הנ"ל נקראת שיטת הריבועים הפחותים והקו המתקבל נקרא קו הרגרסיה או קו הניבויים או קו הריבועים הפחותים. a -בעצם נותן את ערך Y כאשר X הנו אפס על גבי קו הניבויים. הוא ניקרא החותך של הקו. - b הוא שיפוע הקו נותן בכמה בעצם Y משתנה כאשר X גדל ביחידה אחת על גבי קו הניבויים. להלן המשוואות למציאת הפרמטרים של קו הרגרסיה: Y% = bx + a Sˆ b= r S ˆY X a= Y bx טרנספורמציה לינארית והשפעתה על מקדם המתאם טרנספורמצייה לינארית בין אם נעשית על X ובין אם נעשית על y, או בין אם נעשית על שניהם, אינה משנה את עוצמת הקשר. היא עלולה רק לשנות את כיוונו אם השיפועים של שתי הטרנספורמציות שוני סימן.
45 תרגילים: להלן נתונים לגבי שישה תלמידים שנגשו למבחן. בדקו לגבי כל תלמיד את הציון שלו בסוף הקורס וכמו כן את מספר החיסורים שלו מהקורס. מספר חיסורים ציון 80 90 1 90 0 70 70 3 50 4.1 שרטט דיאגראמת פיזור לנתונים. מה ניתן להסיק מהדיאגרמה על טיב הקשר ביו מספר החיסורים של תלמיד לציונו? מיהו המשתנה הבלתי תלוי ומיהו המשתנה התלוי? חשב את מדד הקשר של פירסון. האם התוצאה מתיישבת עם תשובתך לסעיף א'? הסבר ללא חישוב כיצד מקדם המתאם היה משתנה אם היה מתווסף תלמיד שהחסיר 4 פעמים וקיבל ציון 80? נסמן ב- X את ההכנסה של משפחה באלפי. נסמן ב- Y את ההוצאות של משפחה באלפי. נלקחו 0 משפחות והתקבלו התוצאות הבאות: 0 i = 1 Y = 00 i 0 i = 1 X = 40 i. 0 ( Y Y ) = 76 i i 1 0 ( X X ) = 76 i i 1 0 i = 1 ( X X )( Y Y ) = 60.8 i חשב את מדד הקשר הלינארי בין X ל- Y. מיהו המשתנה התלוי? מצא את קו הרגרסיה לניבוי ההוצאה של משפחה על סמך הכנסה שלה. הסבר את משמעות הפרמטרים של קו הרגרסיה. משפחת כהן הכניסה, 15,000 מה ההוצאה הצפויה שלה?
46 נסמן ב- X את ההשכלה של אדם בשנות למו נסמן ב- Y את הכנסתו באלפי. במחקר התקבלו התוצאות הבאות:.3 S ˆ = 5 Y S ˆ = X Y = 8 X =14 COV ( X, Y ) = 7.5 חשב את מדד הקשר של פירסון בין ההשכלה להכנסה. מה ההכנסה הצפויה לאדם שהשכלתו 1 שנים? מה ההשכלה הצפויה לאדם שהכנסתו? 10,000 מיהו המשתנה התלוי ומיהו המשתנה הבלתי תלוי? 4. מבחן בנוי מחלק כמותי ומחלק מילולי. ממוצע הציון בחלק המילולי הנו 100 עם סטית תקן 0 ובחלק הכמותי ממוצע הציון 90 עם סטיית תקן 15. מקדם המתאם בין שני הציונים הוא 0.9. חשבו את השונות המשותפת בין ציוני שני חלקי הבחינה. לW אם יעלו את כל הציונים בחלק המילולי ב-, 0% מה יהיה מקדם המתאם בין הציון המילולי החדש לציון הכמותי ובין הציון המילולי הישן לציון המילולי החדש? נגדיר משתנה חדש W להיות המרחק של הציון בחשיבה מילולית מהציון המקסימאלי בבחינה- 150. מצא את מקדם המתאם בין הציון המילולי ל- W ובין -לציון הכמותי. להלן רשימת טענות, לגבי כל טענה קבע נכון/לא נכון ונמק! מתווך דירות המיר מחירי דירות מדולר לשקל. נניח שדולר אחד הוא. 3.5 אם מתווך הדירות יחשב את מדד הקשר של פירסון בין מחיר הדירה בשקלים למחיר הדירה בדולרים הוא יקבל 1. לסדרה של נתונים התקבל S X = S = 1 Y X = Y = 6 יהיה 1. לכן מדד הקשר של פירסון אם השונות המשותפת של X ושל Y הינה 0 אז בהכרח גם מקדם המתאם של פירסון יהיה 0..5
47 במחקר רצו לבדוק את הקשר בין גודל המנוע של מכונית( (Engine size לבין כוח הסוס שלו (Horsepower) להלן הפלט שהתקבל:.6 מצא את קו הניבויים לניבוי כוח הסוס על סמך גודל המנוע. מה יהיה הניבוי לכוח הסוס של מכונית עם גודל מנוע 3? איזו התפלגות יותר הומוגנית. זו של התפלגות כוח הסוס של המכונית או זו של גודל המנוע? הסבר באמצעות חישו
48 במחקר רפואי רצו לבדוק האם קיים קשר בין רמת ההורמון X בדם החולה לרמת ההורמון Y שלו. לצורך כך מדדו את רמת ההורמונים ההלו עבור חמישה חולים..7 להלן הפלט שהתוכנה הוציאה: Descriptive Statistics Mean N X 16.00 5 Y 15.40? Correlations X Y X Pearson Correlation 1? Sum of Squares and Cross-products 44.000 49.000 Covariance 11.000? N 5 5 Y Pearson Correlation 1 Sum of Squares and Cross-products 49.000 59.00 Covariance 1.50 14.800 N 5 5 מלא את המספרים החסרים בפלט ) במקום סימני השאלה). מצא את קו הניבוי לניבוי ההורמון Yעל סמך ההורמון X. התברר ונפלה טעות ויש להוסיף 1 לכל ערכי הX. חזור על סעיף הקודם לאחר השינוי.
49 קשר בין שני משתנים איכותיים רקע כשנרצה לבדוק האם קיים קשר בין שני משתנים איכותיים. נבנה טבלת שכיחות משותפת. נזהה את המשתנה הבלתי תלוי והמשתנה התלוי. כל קטגוריה של המשתנה הבלתי תלוי תהיה 100% לפי ההתפלגות של המשתנה התלוי. אם ניראה לפחות פעם אחת פער שגדול מ 5% נאמר שיש קשר בין שני המשתנים. ניתן גם להמחיש זאת על ידי שרטוט של דיאגרמת מקלות. תרגילים: בציר האופקי אנו מציבים את המשתנה התלוי. בציר האנכי אנו מציבים את אחוז השכיחות היחסית. להלן תוצאות מחקר שבדק את הקשר בין מין לדעה מסוימת. לגבי כל נחקר נבדק המין שלו ודעתו האישית בדבר סוגיה מסוימת. הנחקרים היו צריכים לענות האם הם בעד, נמנעים או נגד הסוגיה שהוצגה להם. להלן התוצאות:.1 דעה מין בעד נמנע נגד 0 80 40 0 10 0 גבר אישה מהו המשתנה הבלתי תלוי ומהו המשתנה התלוי? האם ניתן להגיד שבקרב הגברים יש נטייה בולטת יותר להיות בעד החוק? האם קיים קשר בין מין לדעה? הסבר. נלקחו 00 אנשים שמתוכם 60 הצהירו שהם עוסקים בפעילות גופנית סדירה. מתוך אלו שעוסקים בפעילות גופנית סדירה שלא עוסקים בפעילות גופנית סדירה 50 נמצאו במצב בריאותי תקין. מתוך אלו 90 נמצאו במצב בריאותי תקין. בנה טבלת שכיחות משותפת לנתונים שהוצגו בשאלה. מהו המשתנה התלוי ומהו המשתנה הבלתי תלוי? האם קיים קשר בין המשתנים? הסבר. תאר את הנתונים על ידי דיאגרמת מקלות מתאימה..
50 קשר בין משתנה איכותי למשתנה כמותי. רקע אם משתנה אחד הוא כמותי ואחד הוא איכותי ניתן לבצע השוואה בין המשתנים על ידי השוואות של תרשימי קופסה. עבור כל ערך של המשתנה האיכותי נשרטט תרשים קופסה באותה מערכת צירים. ניתן להשוות בין תרשימי הקופסה באספקטים הבאים: 1. מרכז ההתפלגות (חציון). פיזור (טווח בין רבעוני) 3. צורת ההתפלגות (סמטרית, אסמטרית ימנית או אסמטרית שמאלית) תרגיל: במטרה לבדוק האם קיים קשר בין המין לציונים בבחינה שרטטו את תרשימי הקופסה הבאים: מהי צורת ההתפלגות של הציונים בקרב הגברים? מהו הטווח הבין רבעוני של התפלגות הציונים בקרב הגברים? מהם המשתנים הנחקרים בשאלה? מיהו הבלתי תלוי ומיהו התלוי? האם קיים הבדל בצורת ההתפלגות של הציונים בין גברים לנשים? האם קיים הבדל במידת הפיזור של הציונים בין גברים לנשים? ה. האם יש השפעה של המין על הציונים? ו.
51 פתרונות מדד הקשר של פירסון מדד הקשר הלינארי שאלה שאלה 1 0.8 בהקלטה Y% = 0.8X + 0.4 0.935-1.4 שאלה 4 שאלה 3 70 0.75 בין הציון המילולי הישן לחדש :1 ביון הציון המילולי החדש לכמותי :0.9 4.5 אלפי ש"ח בין W ל ציון המילולי : 1- בין W לציון הכמותי :0.9- שאלה 6 Y% = 45.43X + 46.89 שאלה 5 183.18 לא נכון נכון כוח סוס שאלה 7 בהקלטה Y% = 1.11X.36 קשר בין שני משתנים איכותיים שאלה 1 המין הוא הבלתי תלוי כן כן קשר בין משתנה איכותי לכמותי. שאלה 1 סימטרית טווח 40 טווח בין רבעוני 0 שאלה בהקלטה הבלתי תלוי הוא פעילות הגופנית. כן בהקלטה המין הוא הבלתי תלוי. לא
5 פרק שלישי התפלגות נורמלית רקע התפלגות זו מאפיינת משתנה רציף כמו גובה של אוכלוסייה, משקל של אוכלוסייה, זמן ייצור וכדומה. בהתפלגות זו רוב האוכלוסייה נמצאת במרכז של ההתפלגות וככל שמתרחקים מהמרכז אחוז המקרים הולך וקטן באופן סימטרי. צורת העקומה של ההתפלגות הנורמלית היא זו: לעקומה זו קוראים גם עקומת גאוס ועקומה אחת נבדלת מהשנייה באמצעות הממוצע וסטיית התקן שלה. אם נתון,למשל, שציוני פסיכומטרי מתפלגים נורמלית עם ממוצע 500 וסטיית תקן 100,נרשום נתון זה בצורה הבאה: ובהכללה, נרשום זאת כך : X ~ N( µσ, ) השטח שמתחת לעקומה יבטא את ההסתברות או הפרופורציה של המקרים המבוקשים. כדי לחשב שטחים אלה נמיר כל התפלגות נורמלית כלשהי להתפלגות נורמלית סטנדרטית. התפלגות נורמלית סטנדרטית היא התפלגות נורמלית שהממוצע שלה הוא אפס וסטיית התקן היא אחת והיא תסומן באות Z. Z ~ N(0,1 ) תהליך התקנון מבוצע על ידי הנוסחה הבאה : הערך המתקבל הוא ציון התקן הנותן בכמה סטיות תקן אנו סוטים מהממוצע. לאחר שמצאנו את ציון התקן נעזר בטבלה שבסופו של דבר תיתן לנו את ההסתברות הרצויה. באופן כללי נתאר את הסכמה הבאה לתהליך: µ = 500 σ = 100 X N(500,100 ) Z = X µ σ X N µ σ (, ) Z N (0,1 ) X µ Z = σ שימוש בטבלה P
53 תרגילים 1. הגובה של אנשים באוכלוסייה מסוימת מתפלג נורמלית עם ממוצע של 170 ס"מ וסטית תקן של 10 ס"מ. מה אחוז האנשים שגובהם מתחת ל- 18.4 ס"מ.? מה אחוז האנשים שגובהם מעל 190 ס"מ? מה אחוז האנשים שגובהם בדיוק 173.6 ס"מ? מה אחוז האנשים שגובהם מתחת ל- 170 ס"מ? מה אחוז האנשים שגובהם לכל היותר 170 ס"מ?. המשקל של אנשים באוכלוסיה מסוימת מתפלג נורמלית עם ממוצע של 60 ק"ג וסטיית תקן של 8 ק"ג. מה אחוז האנשים שמשקלם נמוך מ- 55 ק"ג? מהי פרופורציית האנשים באוכלוסייה שמשקלם לפחות 50 ק"ג? מהי השכיחות היחסית של האנשים באוכלוסייה שמשקלם בין 60 ל- 70 ק"ג? לאיזה חלק מהאוכלוסייה משקל הסוטה מהמשקל הממוצע בלא יותר מ- 4 ק"ג? מה אחוז האנשים באוכלוסיה הזו ששוקלים מתחת ל 140 ק"ג? ה. ה. 3. ציוני מבחן אינטיליגנציה מתפלג נורמלית עם ממוצע מה העשירון העליון של הציונים במבחן האינטיליגנציה? מה העשירון התחתון של ההתפלגות? מהו הציון ש- 0% מהנבחנים מקבלים מעליו? מהו האחוזון ה- 0? מה הרבעון התחתון? 100 ושונות. 5 4. אורך חים של מכשיר מתפלג נורמלית. ידוע שמחצית מהמכשירים חים פחות מ- 500 שעות, כמו כן ידוע ש- 67% מהמכשירים חים פחות מ- 544 שעות. מהו ממוצע אורך חיי מכשיר? מהי סטית בתקן של אורך חיי מכשיר? מה הסיכוי שמכשיר אקראי יחיה פחות מ- 460 שעות? מהו המאיון העליון של אורח חיי מכשיר? 1% מהמכשירים בעלי אורך החים הקצר ביותר נשלח למעבדה לבדיקה ה. מעמיקה. מהו אורך החים המקסימלי לשליחת מכשיר למעבדה?
54 5. הזמן שלוקח לאדם להגיע לעבודתו מתפלג נורמלית עם ממוצע של 40 דקות וסטית תקן של 5 דקות. מה ההסתברות שמשך הנסיעה של האדם לעבודתו יהיה לפחות שלושת רבעי השעה? אדם יצא לעבודתו בשעה 08:10 מביתו. הוא צריך להגיע לעבודתו בשעה. 09:00 מה הסיכוי שיאחר לעבודתו? 6. אורך שיר אקראי המשודר ברדיו מתפלג נורמלית עם תוחלת של 3.5 דקות וסטיית תקן של שלושים שניות. מה ההסתברות שאורך של שיר אקראי המנוגן ברדיו יהיה בין 3 ל.5 דקות? מהו הטווח הבין רבעוני של אורך שיר המשודר ברדיו?
55 6.43% 89.44% 39.44% 0.383 תשובות סופיות התפלגות נורמלית שאלה 1 89.5%.8% 0 שאלה 100% 50% שאלה 3 ה. שאלה 4 500 119. 100 80.8 0.3446 11.6 733 87.4 67 89.95 ה. שאלה 5 ה. שאלה 6 0.1359 0.1587 0.67 0.08
56 פרק רביעי - התפלגות הדגימה ומשפט הגבול המרכזי הקדמה כללית : אוכלוסייה קבוצה שאליה מפנים שאלה מחקרית. למשל, חברת תרופות שמעוניינת לפתח תרופה למחלת הסכרת מתעניינת באוכלוסיית חולי הסכרת בעולם. מדגם חלק מתוך האוכלוסייה. למשל, אם נדגום באקראי 10 אנשים מתוך חולי הסכרת אז זהו מדגם מתוך אוכלוסיית חולי הסכרת. הקורס עוסק ביחסי הגומלין בין המדגם לבין האוכלוסייה : במקרים רבים אין אפשרות לחקור את כל האוכלוסייה כיוון שאין גישה לכולה, היא גדולה מידי, אנו מוגבלים בזמן ובאמצעים טכניים ולכן מבצעים מדגם במטרה לבצע הסקה סטטיסטית מהמדגם לאוכלוסייה. הדגימה בקורס תהייה דגימה מקרית סיכויי להיכלל במדגם. הכוונה לדגימה שבה לכל תצפית באוכלוסייה יש את אותו סטטיסטי גודל המחושב על המדגם. פרמטר גודל המתאר את האוכלוסייה. הסימונים לפרמטר וסטטיסטי בקורס הם שונים והדבר מאד משמעותי למשל, ממוצע סטטיסטי (מדגם) פרמטר (אוכלוסייה) µ P X פרופורציה (שכיחות יחסית) ) p הערה : פרמטר הוא גודל קבוע גם אם אנו לא יודעים אותו סטטיסטי הוא משתנה ממדגם למדגם ולכן נדון בהתפלגות שלו שזה נושא המפגש.
57 תרגילים : 1. מתוך כלל הסטודנטים במכללה שסיימו סטטיסטיקה א נדגמו שני סטודנטים. נתון שממוצע הציונים של כלל הסטודנטים היה 78 עם סטיית תקן של 15.. ה. ו. מי האוכלוסייה? מה המשתנה? מהם הפרמטרים? מהו גודל המדגם? 58% מאזרחי המדינה תומך בהצעת החוק של חבר כנסת מסוים. הוחלט לדגום 00 אזרחים ומתוכם לבדוק מהו אחוז התומכים בהצעת החוק. מי האוכלוסייה? מה המשתנה? מה הפרמטרים? מהו גודל המדגם? מהו הסטטיסטי שמתכננים להוציא מהמדגם? האם הפרמטר או הסטטיסטי הוא משתנה מקרי?
58 התפלגות ממוצע המדגם ומשפט הגבול המרכזי ממוצע האוכלוסייה: µ שונות אוכלוסייה: סטיית תקן של אוכלוסייה: σ התפלגות ממוצע הדגימה x = n x i σ x תכונות התפלגות x תכונה : 1 ממוצע כל ממוצעי המדגם האפשריים שווה לממוצע האוכלוסייה. µ = µ תכונה : σ σ = x n שונות כל ממוצעי המדגם האפשריים שווה לשונות האוכלוסייה מחולק ב- - n תכונה זו נכונה רק במדגם מקרי. יש יחס הפוך בין גודל המדגם לבין שונות ממוצעי המדגם. אם נוציא שורש לשונות נקבל סטיית תקן : σ σ σ ( x) = = n n דגימה מהתפלגות נורמלית אם נדגום מתוך אוכלוסייה שהמשתנה בה מתפלג נורמלית עם ממוצע המדגם גם יתפלג נורמלית: σ x ~ N( µ, ) n x µ Z x = σ µושונות σ ממוצע n משפט הגבול המרכזי אם אוכלוסייה מתפלגת כלשהו עם ממוצע µ ושונות σ אזי עבור מדגם מספיק גדול ) 30 n ( σ ממוצע המדגם גם מתפלג נורמלית ), µ. x ~ f N ( n
59 תרגילים : משקל תינוק ביום היוולדו מתפלג נורמאלית עם ממוצע 3400 גרם וסטיית תקן של 400 גרם. מה ההסתברות שתינוק אקראי בעת הלידה ישקול פחות מ- 3800 גרם?.1 נתון שביום מסוים נולדו 4 תינוקות. ב.. מה ההסתברות שהמשקל הממוצע שלהם יעלה על 4 ק"ג? מה ההסתברות שהמשקל הממוצע של התינוקות יהיה מתחת ל-.5 ק"ג? מה ההסתברות שהמשקל הממוצע של התינוקות יהיה רחוק מהתוחלת בלא יותר מ- 50 גרם? הזמן הממוצע שלוקח לאדם להגיע לעבודתו 30 דקות עם שונות של 16 דקות רבועיות. האדם נוסע לעבודה במשך שבוע 5 פעמים. לצורך פתרון הניחו שזמן הנסיעה לעבודה מתפלג נורמאלית. מה ההסתברות שבמשך שבוע משך הנסיעה הממוצע יהיה מעל 33 דקות? מהו הזמן שבהסתברות של 90% ממוצע משך הנסיעה השבועי יהיה פחות ממנו? מה ההסתברות שממוצע משך הנסיעה השבועי יהיה מרוחק מ- 30 דקות בלפחות דקות?. נפח היין בבקבוק מתפלג נורמאלית עם תוחלת של 750 סמ"ק וסטיית תקן של 10 סמ"ק. בארגז 4 בקבוקי יין. מה ההסתברות שהנפח הממוצע של הבקבוקים בארגז יהיה בדיוק 755 סמ"ק? בארגז 4 בקבוקי יין. מה ההסתברות שהנפח הממוצע של הבקבוקים בארגז יהיה יותר מ 755 סמ"ק? בארגז 4 בקבוקי יין. מה ההסתברות שהנפח הממוצע של הבקבוקים בארגז יהיה לפחות 755 סמ"ק? בקבוקיי היין שבארגז נמזגים לקערה עם קיבולת של שלושה ליטר. מה ההסתברות שהיין יגלוש מהקערה?.3
60 משתנה מתפלג נורמאלית עם תוחלת 80 וסטיית תקן. 4 מה ההסתברות שממוצע המדגם יסטה מתוחלתו בלא יותר מיחידה כאשר גודל המדגם הוא 9? מה ההסתברות שממוצע המדגם יסטה מתוחלתו בלא יותר מיחידה שגודל המדגם הוא 16? הסבר את ההבדל בתשובות של שני הסעיפים..4 לפי הערכות הלשכה המרכזית לסטטיסטיקה השכר הממוצע במשק הוא 8000 עם סטיית תקן של. 3000 מה ההסתברות שבמדגם מקרי של 100 עובדים השכר הממוצע יהיה יותר מ-? 8500.5 מטילים קובייה 50 פעמים בכל פעם מתבוננים בתוצאה של הקובייה. מה ההסתברות שהממוצע של התוצאות יהיה לפחות 3.7 ב- 50 ההטלות?.6 אורך צינור שמפעל מייצר הינו עם ממוצע של 70 ס"מ וסטיית תקן של 10 ס"מ נלקחו באקראי 100 מוטות, מה ההסתברות שממוצע אורך המוטות יהיה בין 68 ל 78 ס"מ? יש לחבר בניינים באמצעות מוטות. המרחק בין שני הבניינים הינו 700 ס"מ. מה ההסתברות ש 100 המוטות יספיקו למלאכה? מה צריך להיות גודל המדגם המינימאלי, כדי שבהסתברות של 5% ממוצע המדגם יהיה קטן מ- 69 ס"מ. העזר במשפט הגבול המרכזי..7
61 תשובות סופיות להתפלגות הדגימה התפלגות ממוצע מדגם ומשפט הגבול המרכזי שאלה שאלה 1 0.0465 0.8413 3.9 0.0013 0.68 0 0.1974 שאלה 3 שאלה 4 0.5468 0 0.686 0.1587 0.1587 0.5 שאלה 5 0.0475 שאלה 6 שאלה 7 0.977 0.08 71 0.1814
6 פרק חמישי - שאלות אמריקאיות על כל חומר הלימוד הנתונים הבאים מתייחסים לשאלות 1-4 פסיכולוגים צפו במשך שבוע שלם בהתנהגותם של 8 ילדים בגן חובה. לאחר מכן נאלצו לדווח על רמת הביטחון העצמי של כל ילד בסקלה של 1 עד 5. כאשר 5 נחשב לרמת בטחון עצמי גבוהה ו- 1 לרמת בטחון עצמי נמוכה. להלן סיכום התוצאות: בטחון עצמי 1 מספר הילדים 6 7 10 4 1 3 4 5 שאלה 1 מהו סולם המדידה של המשתנה הנחקר? שמי. סדר. רווח. מנה. שאלה מהי הדרך הגרפית המתאימה ביותר כדי לתאר את הנתונים? טבלת שכיחויות. דיאגרמת מקלות. היסטוגרמה. דיאגרמת עוגה. שאלה 3 מהו השכיח של התפלגות הנתונים שנאספו? 1 3 10
63 שאלה 4 התווסף עוד ילד עם רמת בטחון עצמי נמוכה לכן סטיית התקן של המשתנה הנחקר כתוצאה מההוספה: תגדל תקטן לא תשתנה אין לדעת שאלה 5 אם נרצה לבדוק האם המוצא ) אסיה, אירופה,אפריקה,אמריקה ( משפיע על ההשכלה בשנים של העובדים נעשה זאת על ידי. מדד הקשר הלינארי. טבלת שכיחות משותפת. תרשימי קופס דיאגרמת פיזור. הנתונים הבאים מתייחסים לשאלות 6-10 להלן שלוש התפלגויות נורמליות של שלוש קבוצות שונות ששורטטו באותה מערכת צירים. ההתפלגויות מוספרו כדי להבדיל בניהן. שאלה 6 לאיזו התפלגות הממוצע הגבוה ביותר? 1 3 אין לדעת.
64 שאלה 7 לאיזו התפלגות השכיח הגדול ביותר? 1 3 אין לדעת שאלה 8 במה התפלגות 1 ו זהות? בעשירון העליון. בממוצע. בשונות. אף אחת מהתשובות אינה נכונה. שאלה 9 איזה מהמשפטים הבאים נכון לגבי התפלגות מספר 3? הממוצע שווה לחציון בהתפלגות. הטווח שווה לטווח הבין רבעוני. העשירון התחתון שווה לעשירון העליון. סטיית התקן היא אפס. שאלה 10 לאיזו התפלגות סטיית התקן הקטנה ביותר? 1 3 אין לדעת.
65 הנתונים הבאים מתייחסים לשאלות : 15-11 מוכר החליט לתת 0% הנחה לכל המוצרים שבחנות שלו. בש"ח וב- Yאת המחיר של המוצר אחרי ההנחה בש"ח. נסמן ב- X המחיר של מוצר לפני ההנחה המוכר חישב את המדדים הבאים לפני ההנחה: 80 ממוצע 70 חציון 300 שונות 48 טווח כמו כן הוא חישב גם את כל הנתונים לגבי המשתנה Y. שאלה 11 מה יהיה הממוצע של המחירים בש"ח אחרי ההנחה? 16 64 80 70 שאלה 1 מה יהיה טווח המחירים בש"ח אחרי ההנחה? 9.6 38.4 48 70 שאלה 13 מה תהיה השונות של המחירים אחרי ההנחה? 300 60 40 19
66 שאלה 14 מהו מקדם ההשתנות (CV) של המחירים לפני ההנחה? 3.75 0.67 0.165 4.619 שאלה 15 אם המוכר יחשב את מקדם המתאם על 0 1 1- אין לדעת. Xו Y התוצאה שתתקבל תהיה? שאלה 16 בהתפלגות אסמטרית ימנית סטיית התקן יותר גדולה מאשר בהתפלגות אסמטרית שמאלית. הטענה תמיד נכונה. הטענה תמיד אינה נכונה בהכרח. אין מספיק נתונים כדי לדעת. שאלה 17 ביחס לציר המספרים רוב הערכים בהתפלגות א-סימטרית ימנית נמצאים: בערכים הגבוהים. בחלוקה זהה בין הערכים הגבוהים והנמוכים. בערכים הנמוכים. לא ניתן לדעת.
67 שאלה 18 הוספת גודל קבוע לכל תצפיות סדרת נתונים. תגדיל את סטיית התקן. תקטין את סטיית התקן. לא תשנה את סטיית התקן. לא ניתן לדעת. הנתונים הבאים מתייחסים לשאלות 19-1 חוקר רצה לאפיין את הקשר בין מספר השעות בשבוע שסטודנט מקדיש לבילויים לבין הציון הממוצע שלו בסוף הסמסטר. לשם כך הוא אסף נתונים של 15 סטודנטים ויצר בעזרת האקסל דיאגרמת פיזור. החוקר אף הוסיף לדיאגרמה את קו המגמה המתאים לנתונים. שאלה 19 מיהו המשתנה הבלתי תלוי? ציון ממוצע. מספר שעות לבילוי. מספר הסטודנטים.
68 שאלה 0 מה ניתן לומר על כיוון הקשר בין מספר שעות הבילוי השבועיות לבין הציון הממוצע של הסמסטר? (הסתמכו על הנתונים ולא על דעתכם האישית...) ככל שמבלים יותר הציון נוטה לרדת. אין קשר בין שעות הבילוי לציון. ככל שמבלים פחות הציון נוטה לרדת. ככל שהציון יורד הסטודנט מבלה פחות. שאלה 1 איזה מהמתאמים הבאים הוא המתאים ביותר לתיאור הקשר בין שני המשתנים? 0.85 0.15 0.85 0.15 שאלה סטיית התקן של משתנה מסוים X- הייתה. הוחלט לבצע טרנספורמציה למשתנה. Y = 3X הבא : שונות Yאחרי הטרנספורמציה היא: לפי הקשר 4 6 10 1 ה. 36
69 הנתונים הבאים מתייחסים לשאלות 3-5 בכיתה 30 סטודנטים אותם 30 נבחנו במבחן באנגלית ובמבחן בסטטיסטיקה. להלן פלט לגבי ציונים: ממוצע שונות אנגלית 90 סטטיסטיקה 80 100 11 שאלה 3 באיזה מקצוע להתפלגות הציונים פיזור יחסית יותר גבוה? אנגלית. סטטיסטיקה אותו פיזור בשני המקצועות באופן יחסי. אין מספיק נתונים כדי לענות על השאלה. שאלה 4 יערה קיבלה 9 באנגלית ו 8 בסטטיסטיקה. באיזה מקצוע היא יותר טובה יחסית לכיתתה? אנגלית. סטטיסטיקה אותו דבר יחסית. אין מספיק נתונים כדי לענות על השאלה. שאלה 5 עודד שקיבל 80 בסטטיסטיקה העתיק בבחינה. הוחלט לחשב מחדש את השונות של הציונים בסטטיסטיקה בלעדיו. השונות החדשה : תקטן תגדל לא תשתנה אין לדעת
70 שאלה 6 חושב הטווח הבין רבעוני עבור התפלגות מסוימת והתקבלה התוצאה אפס. לכן: לפחות 50% מהתצפיות זהות. סטיית התקן היא אפס. ההתפלגות היא סימטרית. מצב זה כלל לא יתכן. שאלה 7 נתונה התפלגות של משתנה כלשהו. הטווח של 0% התצפיות הגבוהות ביותר שווה לטווח של 0% התצפיות הנמוכות ביותר. הטווח של 50% התצפיות המרכזיות הינו הטווח הבין רבעוני. הרבעון העליון שווה לרבעון התחתון. הטווח הבין רבעוני הוא מחצית מהטווח. הנתונים הבאים מתייחסים לכל השאלות 8-9 חוקר רצה לחקור את הקשר הקווי שבין הציון במבחן הרשות בסטטיסטיקה ומימון לבין מספר שעות ההכנה של הסטודנטים למבחן. במדגם של 100 סטודנטים שנבחנו בקורס נרשמו התוצאות הבאות : הציון הממוצע של הסטודנטים היה 65 עם סטיית תקן של 7. מספר שעות ההכנה הממוצע היה 30 עם סטיית תקן של 18. מקדם המתאם בין הציון לשעות ההכנה היה 0.8. שאלה 8 על פי משוואת הרגרסיה של שעת הכנה נוספת משפרת את ציון המבחן ב: 1.5 נקודות. 0.53 נקודות. 0.66 נקודות. 1.0 נקודות 0.96 נקודת. ה.
71 שאלה 9 על פי משוואת הרגרסיה תלמיד שייגש למבחן ללא שעות הכנה כלל יקבל ציון :.9 0. 33. 4..6 ה. שאלה 30 אם מקדם המתאם בין שני משתנים הוא שלילי אזי: הערכים של המשתנים הם שליליים. ה. ככל שמשתנה אחד עולה השני עולה. ככל שמשתנה אחד יורד השני יור קיימת טרנספורמציה לינארית שלילית בין שני המשתנים. אף טענה אינה נכונה. שאלה 31 ככל שההתפלגות הנורמאלית חדה וצרה יותר במרכזה אזי: השונות שלה יותר גבוהה ה. הממוצע שלה יותר גבוה היא מייצגת אנשים גבוהים יותר השונות שלה נמוכה יותר החציון שלה גבוה יותר שאלה 3 נתונה סדרה של N מדידות שלא כולן זהות. נניח ששתי מדידות נוספות צורפו לסדרה ושתיהן זהות לממוצע הסדרה. האם וכיצד תשנה הוספת שני הערכים החדשים את שונות הסדרה? שונות הסדרה תקטן שונות הסדרה תגדל לא ניתן לדעת, זה תלוי במספר התצפיות לא ניתן לדעת, זה תלוי בערכו של הממוצע.
7 שאלה 33 הוותק הממוצע של עובדי מפעל מסוים הוא 1 שנים וסטיית התקן של הוותק 8 שנים. בעוד 3 שנים אם כל העובדים ימשיכו לעבוד במפעל ולא יתווספו עובדים חדשים הממוצע 15 שנים וסטיית התקן 8 שנים נקבל כי: הממוצע 1 שנים וסטיית התקן 11 שנים הממוצע 15 שנים וסטיית התקן 11 שנים הממוצע 1 שנים וסטיית התקן 8 שנים שאלה 34 שני סטודנטים עזבו את החוג לכלכלה. הציון של כל אחד מהם היה שווה לציון הממוצע. כיצד תשפיע עזיבתם על הממוצע ושונות ציוני התלמידים הנותרים? אם הממוצע לפני העזיבה היה 80 והשונות 100. הממוצע לא ישתנה והשונות תגדל. ה. הממוצע לא ישתנה והשונות תקטן. הממוצע לא ישתנה והשונות לא תשתנה. הממוצע יקטן והשונות תגדל. הממוצע יגדל והשונות תקטן. שאלה 35 החציון של סדרת נתונים מסוימת הוא 90. הוסיפו שתי תצפיות נוספות: 100 ו- 0, לכן החציון: יקטן. יגדל. לא ישתנה. לא ניתן לדעת. שאלה 36 סטיית התקן של המשכורות בחברה הנה 3000 אם נוסיף לכל עובדי החברה 00 לשכר אז: סטיית התקן תגדל אך אין לדעת בכמה. סטיית התקן תגדל בהכרח ב 00. סטיית התקן לא תשתנה. סטיית התקן תקטן. ה. לא ניתן לדעת.
73 שאלה 37 ממוצע של סידרת נתונים הנה 50 וסטיית התקן 10. אם נוסיף עוד שתי תצפיות שערכן 50 סטיית התקן : תקטן. תגדל. לא תשתנה. אין לדעת. שאלה 38 בהתפלגות אסימטרית עם זנב ימני ציון התקן של הרבעון התחתון: בהכרח שלילי. בהכרח חיובי. אפס. לא ניתן לדעת. שאלה 39 אם השונות של המשתנה שווה אפס. מה ניתן לומר על המשתנה? עולה. יורד קבוע נורמלי ה. לא ניתן לדעת שאלה 40 נתון משתנה מקרי W עם שונות. 10 מה תהיה השונות אם נכפיל את ערכי המשתנה W פי? 0 10 400 40 ה. 0
74 שאלה 41 נמצא שקיים מקדם מתאם חיובי בין הציון בעברית לציון בחשבון בבחינה לכן : הדבר מעיד שהציונים בכתה היו חיוביים. ככל שהציון של תלמיד יורד בחשבון יש לו נטייה לרדת בעברית. ככל שהציון של תלמיד עולה בחשבון יש לו נטייה לרדת בעברית. אף אחת מהתשובות לא נכונה. הנתונים הבאים מתייחסים לשאלות 4-44 בגרף הבא מתוארת דיאגרמת פיזור של שני משתנים X (משתנה בלתי תלוי-בציר האופקי) ו- Y (משתנה תלוי), כמו כן הועבר קו הרגרסיה וחושב ריבוע מקדם המתאם. 35 30 R² = 0.5 5 0 15 10 5 0 0 4 6 8 10 1 שאלה 4 לאור הנתונים המופיעים בדיאגרמה איזה מבין הערכים הבאים מתאים להיות התוצאה של מקדם המתאם שתופעל על הנתונים? 0.5-0.5-0.7 0.7
75 שאלה 43 מה תהיה התוצאה הכי מתאימה לפרמטר b ברגרסיה? 0.5.79 -.79-0.5 שאלה 44 מהו טווח התפלגות התצפיות של המשתנה הבלתי תלוי X? 5 1 6.5 7 הנתונים הבאים מתייחסים לשאלות 45-47 במפעל לייצור מצברים לרכב בדקו במשך 40 ימים את התפוקה היומית ) מספר מצברים במאות) ואת מספר הפועלים שעבדו באותו היום. להלן טבלה המסכמת את האינפורמציה שנאספה על שני המשתנים: מספר פועלים תפוקה 15 48 ממוצע 10 סטיית תקן שאלה 45 איזו טענה מהטענות הבאות נכונה? המספר המקסימלי של העובדים במפעל הוא 17 עובדים. התפוקה הכוללת במשך ה- 40 ימים הללו הייתה 19,000 מצברים. הטווח של התפלגות תפוקת המצברים הוא 0 מאות. אף אחת מהטענות לא נכונה.
76 שאלה 46 לפי קריטריון ) CV מקדם ההשתנות ( הפיזור באופן יחסי שווה בין התפוקה היומית לכמות הפועלים העובדים ביום. הפיזור יחסית יותר גדול עבור התפוקה היומית מאשר עבור מספר הפועלים ביום. הפיזור יחסית יותר גדול עבור מספר הפועלים ביום מאשר עבור התפוקה היומית. אין מספיק נתונים כדי לחשב את.CV שאלה 47 באחד הימים מתוך כלל הימים שנבדקו התפוקה הייתה 50 מאות מצברים ובאותו היום עבדו 13 פועלים. מה יותר חריג באותו היום יחסית לשאר הימים שנבדקו נתוני התפוקה או כמות הפועלים? חריגים באותה מידה. כמות הפועלים. התפוקה. חסרים נתונים כדי לדעת זאת. שאלה 48 התפלגות הציונים במבחן מסוים היא סימטרית לכן: סטיית התקן של הציונים היא אפס. הציון החציוני שווה לציון הממוצע. העשירון העליון שווה לעשירון התחתון של הציונים. כל הטענות בשאר הסעיפים לא נכונות. שאלה 49 מקדם המתאם בין ההכנסה לבין ההוצאה של 10 משפחות חושב והתקבל. 0.7 אם חל גידול של 5% בהכנסת האוכלוסייה כולה וגידול של 7% בהוצאה שלה, אזי מקדם המתאם בין ההכנסה החדשה של 10 המשפחות הנ"ל: ה. לא ישתנה ויישאר 0.7. יהפוך להיות 0.7. - אין מספיק נתונים כדי לדעת מה יהיה מקדם המתאם. אפשר לדעת רק מה יהיה מקדם המתאם באוכלוסייה כולה. בין 0.7 ל-.0.7-
77 שאלה 50 איזה מהמשפטים הבאים אינו נכון? אם מוסיפים קבוע לתצפיות הדבר לא משפיע על פיזור הנתונים. בהתפלגות סימטרית הממוצע שווה לשכיח. אם כל התצפיות זהות סטיית התקן בהכרח אפס. הכפלה בקבוע משנה את סטיית התקן. שאלה 51 איזה מהמשפטים הבאים נכון? הטווח הבין רבעוני הוא אפס רק אם כל הצפיות זהות. הרבעון העליון שווה לרבעון התחתון בהתפלגות סימטרית. בהתפלגות סימטרית החציון שווה לממוצע. 90% מהתצפיות נמצאות מעל האחוזון התשעים. שאלה 5 מעוניינים למצוא את הסיכוי לאיחוד שני מאורעות. מותר לחבר הסתברויות אלה בשביל זה,רק אם המאורעות: זרים. לא זרים תלויים בלתי תלויים שאלה 53 הכפלה בגודל קבוע לכל תצפיות סדרת נתונים. תגדיל את סטיית התקן. תקטין את סטיית התקן. לא תשנה את סטיית התקן. לא ניתן לדעת.
78 שאלה 54 בעיר "חולית", בקיץ, כמות הגשם היורד בחודש מתפלג נורמלית עם תוחלת 10 מ"מ וסטיית התקן, ובחורף עם תוחלת 10 מ"מ וסטיית התקן 3. איפה יש יותר סיכוי שירד יותר מ 1 מ"מ גשם? בקיץ בחורף סיכוי שווה. לא ניתן לדעת. שאלה 55 בהתפלגות שבה המאון ה- 40 שווה לממוצע. ציון התקן של הממוצע יהיה: חיובי. שלילי. אפס. לא ניתן לדעת.
79 -ל וסנכיה ואדיו ןוטרסב אלמ ןורתפל רתפו בתכ לדנק קרב - :תונורתפ 1 ב 11 ב 1 ג 31 ד 38 א 47 ב ב 1 ב ה 3 א 39 ג 48 ב 3 ג 13 ד 3 ב 33 א 40 ד 49 א 4 א 14 ג 4 ב 34 א 41 ב 50 ב 5 ג 15 ב 5 ב 35 ג 4 ג 51 ג 6 ג 16 ג 6 א 36 ג 43 ג 5 א 7 ג 17 ג 7 ב 37 א 44 א 53 ד 8 ב 18 ג 8 ד 45 ב 54 ב 9 א 19 ב 9 א 46 ב 55 ג 10 א 0 א 30 ה